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摘要 : [目的 /意义 ] 当前 知识 聚合 模式 研究 侧重 “依据 何 种 知识 关联 开展 知识 聚合 ” ,本文 补充 性 地 探索 
“利用 知识 关联 将 知识 单元 聚合 成 何 种 形式 ”这 一 后 续 问题 ,以 完善 知识 聚合 模式 研究 和 引导 实践 的 深入 。 
[方法 /过 程 ] 借鉴 化 学 领域 中 对 聚合 反应 两 大 类 型 划分 的 方法 ,提出 以 “是 否 保 留 知 识 单元 间 及 其 关联 间 的 差 
异性 ”为 根据 ,将 知识 聚合 划分 为 知识 类 聚 和 知识 共聚 ,并 探讨 知识 共聚 的 基本 实现 形式 。[ 结果 /结论 ] 领域 


知识 


是 知识 共聚 开展 的 基础 ;以 文档 、 词 语 为 基本 知识 单元 粒度 ,以 用 户 需 求 入 口 和 聚合 目标 资源 为 维度 ,知识 


共聚 可 通过 四 种 基本 形式 实现 :基于 分 面 导 航 、 基 于 多 维 概念 关联 推荐 .基于 知识 元 链接 、 基 于 资源 潜在 关联 发 


现 。 
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知识 聚合 模式 ”知识 共聚 ”领域 知识 分 析 ”领域 概念 关联 


当前 ,知识 聚合 是 图 情 学 科 的 研究 热点 。“ 聚 合 ” 
-6 济 与 英文 “Aggregation” 相 对 应 ,是 指 由 异类 成 分 组 
WRA ,或 多 个 细小 单元 组 合 形成 的 整体 ""。 具 体 
应 时 层面 ,较为 典型 的 是 化 学 领域 中 的 “聚合 反应 ”， 
外 最 体 小 分 子 通 过 相互 连接 形成 新 的 高 分 子 材料 。 
在 往 息 科学 及 其 相关 领域 ,以 知识 .数据 .信息 .资源 为 
对 莹 ,又 有 “聚合 "“ 融 合 "“ 集 成 /整合 "等 概念 。 李 亚 
婷 对 相关 概念 进行 了 辨析 和 界定 :聚合 侧重 于 挖 气 对 
象 间 多 种 关联 并 建立 相应 体系 ;融合 强调 对 象 经 处 理 
后 产生 的 新 变化 ;集成 .整合 则 关注 利用 对 象 间 的 共性 
规则 对 其 进行 综合 管理  。 知 识 聚 合 是 在 信息 资源 快 
速 增长 导致 有 价值 的 知识 资源 高 度 分 散 和 无 序 分 布 的 
背景 下 ,通过 发 现 *“ 知 识 碎 片 " 间 的 关联 来 对 知识 资源 
进行 多 维 组 合 上 9 ,以 向 用 户 提供 体系 化 的 、 既 可 横向 扩 
散 又 可 纵向 深入 的 知识 内 容 。 与 数据 集成 、 信 息 整合 
相 比 ,知识 聚合 在 聚合 强度 .聚合 粒度 上 都 有 质 的 提 
升 。 知 识 聚 合 是 实现 基于 用 户 需求 的 多 元 化 ` 深 层次 、 
开放 性 知识 组 织 和 利用 的 前 提 。 

近年 来 ,国内 图 书 情报 领域 以 “聚合 "为 题 的 研究 


项 目 较 多 ,因而 也 涌现 出 一 大 批 成 果 。 关 于 知识 聚合 
项 目 和 研究 成 果 , 大 多 以 学 术 资 源 ( 以 馆藏 资源 为 典型 
代表 ) 为 对 象 *“。 而 关于 知识 聚合 模式 的 研究 ,大 多 
侧重 从 聚合 所 依据 的 知识 关联 来 区 分 。 例 如 , 贺 德 
等 人 将 基于 语义 的 馆藏 资源 深度 聚合 方式 归纳 为 基于 
概念 关联 .引证 关系 和 科研 本 体 三 类 bU AE AE 
馆藏 资源 聚合 模式 归纳 为 传统 聚合 模式 RERA 
式 ,前 者 包括 基于 编目 和 基于 元 数据 的 模式 ;后 者 包括 
基于 本 体 .基于 关联 数据 .基于 主题 模型 和 基于 计量 分 
析 的 知识 聚合 模式 "1  。 此 后 关于 知识 聚合 的 研究 ,也 
大 都 可 纳入 这 些 类 型 。 值 得 一 提 的 是 , 曹 树 金 等 人 在 
梳理 信息 聚合 的 概念 .构成 后 ,提出 的 信息 聚合 模式 不 
仅 包括 基于 关系 的 聚合 .粒度 聚合 ,还 包括 基于 情景 的 
NEU. 

尽管 当前 研究 已 深入 地 探索 了 “应 该 依据 什么 来 
聚合 知识 ”, 但 这 只 是 知识 聚合 模式 的 前 半 段 问题 。 在 
获得 丰富 的 、 深 层次 的 知识 关联 后 , “利用 这 些 关联 将 
知识 单元 聚合 成 什么 样 ” ,也 应 是 知识 聚合 模式 研究 所 
解答 的 问题 ,但 当前 这 方面 研究 相对 较 少 。 相 当 一 部 
分 知识 聚合 研究 中 ,花费 大 量 精力 得 到 了 深层 次 的 知 
识 关 联 (如 语义 关联 ) ,但 最 终 它们 被 用 于 对 知识 单元 
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进行 聚 类 ,例如 :优化 相似 度 计算 以 划分 类 团 ,或 者 构 
建 关系 网 络 以 划分 子 群 。 

事实 上 , 聚 类 只 是 知识 聚合 的 一 种 初级 方式 。 在 
充分 利用 知识 关联 细 粒 度 .多样 化 特性 的 前 提 下 ,可 针 
对 用 户 需 求 和 知识 资源 特点 实现 多 种 知识 聚合 方式 。 
正如 在 化 学 领域 ,不 同类 型 分 子 单 体 通过 多 种 作用 力 
聚合 可 形成 丰富 多 样 的 共聚 化 合 物 。 受 此 局 发 ,本 文 
从 "如何 充 分 利用 知识 关联 的 多 样 化 差异 开展 知识 聚 
合 " 为 目标 ,提出 知识 共聚 模式 。 首 先 , 将 知识 聚合 划 
分 为 知识 类 聚 和 知识 共聚 这 两 种 基本 模式 并 论述 其 特 
点 ;其 次 ,从 领域 知识 分 析 视 角 探 讨 实现 知识 共聚 的 基 
础 ;以 此 为 基础 ,提出 “词语 -文档 ”体系 下 知识 共聚 
的 四 种 基本 实现 形式 。 


2 知识 类 聚 与 知识 共聚 


Jj 在 化 学 领域 ,根据 参与 聚合 的 单 体 类 型 是 否 一 到 
( 马 即 聚合 作用 力 是 否 单一 ) ,可 将 聚合 反应 分 为 均 聚 
拘 卫 和 共聚 反应 两 种 模式 : 均 聚 反应 是 指 同类 单 体 分 
承 搂 同一 作用 力 形成 聚合 物 ,而 共聚 反应 是 指 多 种 类 
型 丽 单 体 分 子 按 不 同 作用 力 形成 聚合 物 ”。 相 应 地 ， 
花 知 识 聚 合 中 也 存在 类 似 的 模式 差别 :如 果 不 考 虑 知 
讽 囊 元 的 类 型 差异 ,将 其 关联 简化 为 单一 的 “相关 关 
AN Dinos tmt DUE), PLC HM M RH AR 
类 法 ;如 果 考 虑 知识 单元 的 类 型 差异 ,以 知识 单元 差异 
视 儿 下 形成 的 细 粒 度 知识 关联 为 依据 ,开展 的 聚合 称 
JAER, 
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合 模式 ,由 于 在 聚合 中 不 考虑 知识 单元 类 型 差异 ,因此 
“相关 关系 "的 量化 计算 是 核心 。 常 见 的 知识 单元 相 
关 关 系 有 共 现 关系 和 相似 性 关系 。 共 现 关系 是 指 知识 
单元 在 相同 时 间 、 空 间或 知识 场景 中 出 现 ,其 量化 方法 
有 邻近 指数 、 等 价 系数 .基于 改进 的 TF -IDF 算法 等 。 
相似 性 关系 的 量化 主要 包括 三 类 :一 是 以 个 体 共 现 关 
系 为 基础 进行 的 相似 度 计算 ;二 是 依据 一 定 的 语义 知 
识 库 将 个 体 的 语义 关联 转化 为 相似 度 ; 三 是 融合 前 两 
种 相似 度 结果 , 称 为 语义 相似 度 计算 ” 。 

知识 类 聚 的 实现 形式 主要 有 两 种 :一 种 是 将 知识 


现 方式 。 

马 文 峰 等 人 指出 ,以 分 类 法 /主题 词 表 为 代表 的 概 
念 类 聚 体系 不 强调 对 概念 间 关 联 的 组 织 , 尚 未 深入 到 
语义 层面 ,因此 是 较 低层 次 的 知识 组 织 体 系 ""。 相 应 
地 ,知识 类 聚 也 是 较 低层 次 的 知识 聚合 模式 。 类 聚 结 
果 将 多 维 知识 关联 映射 到 单一 维度 的 相关 关系 上 ,不 
利于 实现 知识 资源 的 多 维 组 合 ,因此 在 实践 应 用 中 存 
在 明显 的 缺陷 。 其 典型 问题 是 “ 知 其 然而 不 知 其 所 以 
然 ”, 即 :知道 类 聚 的 结果 间 存 在 关联 ,但 不 知道 存在 何 
种 关联 ,因而 不 利于 用 户 需 求 的 扩展 、 细 化 和 引导 。 
2.2 ”知识 共聚 

知识 共聚 模式 并 非 凭空 而 来 。 当 前 知识 组 织 的 主 
要 任务 已 由 排序 和 归属 转变 为 知识 关联 和 链接 的 构 
建 ,在 知识 组 织 体系 中 ,本 体 、 概 念 地 图 相对 于 分 类 
法 .主题 词 表 等 更 为 高 级 ,其 原因 是 它们 保留 了 知识 单 
元 和 知识 关联 的 语义 类 型 差异 ""。 类 似 地 ,知识 共聚 
注重 在 特定 知识 场景 下 ,将 知识 单元 以 多 样 化 的 关联 
为 作用 力 聚 合成 可 解决 特定 问题 或 任务 的 知识 共聚 
体 , 因 此 它 是 一 种 更 为 深层 的 知识 聚合 方式 。 

在 实践 中 ,知识 共聚 的 典型 应 用 是 分 面 导航 , 当 用 
户 检索 或 点 击 某 一 个 主题 时 ,分 面 导航 系统 会 展现 相 
关 结 果 与 检索 对 象 之 间 多 维 关联 ,这 种 模式 在 网 络 信 
息 组 织 上 具有 明显 优势 ” 。 以 检索 “手机 ”为 例 ,百度 
的 相关 搜索 词 引导 和 京东 的 商品 导航 分 别 对 应 知识 类 
聚 模式 和 知识 共聚 模式 ,后 者 包含 多 个 与 手机 属性 相 
关 的 侧面 。 此 外 ,除了 以 词语 (概念 ) 为 粒度 开展 知识 
共聚 ,以 句子 文档、 用户 为 粒度 的 知识 聚合 均 可 由 知 
识 类 聚 模式 深化 到 知识 共聚 模式 。 例 如 , 唐 晓 波 等 人 
提出 对 关于 某 一 事件 的 微 博 按 句子 逻辑 关系 进行 聚 
合 ,由 “起 因 ” 到 “事件 ”并 导向 结果” 。 

由 此 可 见 , 知 识 共聚 的 结果 是 一 个 包含 多 个 侧面 
(由 知识 单元 及 其 关联 的 类 型 差异 决定 ) 的 立体 结构 ， 
从 不 同 侧面 进行 解读 可 获得 不 同 的 知识 单元 类 团 。 用 
户 在 得 到 知识 共聚 结果 后 ,可 根据 其 特定 需求 选择 利 
相应 侧面 。 知 识 类 聚 的 结果 尽管 也 可 视 作 一 个 立体 
空间 ,但 它 缺 少 知识 单元 差异 支撑 下 的 侧面 ,因而 只 能 
按照 距离 划分 类 簇 。 因 此 知识 共聚 模式 保障 了 聚合 结 
果 的 完整 性 和 应 用 灵活 性 , 相 比 知识 类 聚 模 式 更 符合 


y 


单元 置 于 相应 的 特征 空间 内 ,以 距离 为 依据 来 划分 类 
,典型 的 如 词语 或 文本 的 聚 类 、 分 类 ; 另 一 种 是 将 知 
识 单元 及 相关 关系 表示 为 网 络 ,基于 特定 的 网 络 指标 
和 网 络 子 群 发 现 技术 来 划分 类 团 ,典型 的 如 共 词 网 络 
中 词 篮 划 分 。 由 此 可 见 , 聚 类 只 是 知识 类 聚 的 一 种 实 
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有 户 知识 探索 和 知识 利用 的 需要 。 
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3 ”知识 共聚 的 基础 :领域 概念 关联 
3.1 知识 组 织 中 的 领域 分 析 视角 
在 知识 生产 、 交 流 和 利用 中 ,用 户 需 求 和 知识 内 容 
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ER, KM, P 8b. 知识 共聚 :领域 分 析 视 角 下 的 知识 聚合 模式 [J]. 图 书 情报 工作 ,2018 ,62(8) :115 - 122. 


通常 具有 领域 性 ,因此 知识 组 织 需要 以 领域 知识 为 背 
景 开 展 。 领 域 知识 ( Domain Knowledge ) 与 通用 知识 
(如 常识 ,逻辑 规则 和 数学 运算 知识 ) 相对 应 ,是 指 特 
定 领域 内 重要 概念 及 它们 之 间 的 关联 。 在 信息 服 
务 和 情报 工作 中 ,仅仅 追求 信息 组 织 方式 的 优化 而 忽 
略 知识 的 领域 特性 ,会 导致 " 重 形式 轻 内 容 ”" 的 问 
题 “ 。 因 此 ,情报 学 研究 方法 中 产生 了 经 典 的 “领域 
知识 分 析 范 式 ” ,其 核心 思想 是 立足 于 特定 知识 领域 来 
审视 人 类 信息 活动 行为 "9 。 实 际 上 ,领域 知识 分 析 中 
知识 元 素 的 组 织 仍然 依托 于 传统 的 通用 知识 组 织 手 
段 ,只 是 在 其 中 引入 一 些 特定 的 技术 方法 ,以 使 之 更 
符合 面向 特定 领域 的 知识 组 织 和 知识 服务 目标 。 

午 向 特定 领域 进行 知识 组 织 时 ,以 领域 知识 分 析 
范 戒指 导 的 知识 组 织 体系 可 取得 更 好 的 效果 。M.，K. 
Byckland 等 人 的 研究 表明 ,依据 特定 领域 专业 语言 纺 
制 的 索引 相 比 综合 索引 可 带 来 明显 的 检索 效果 优 
1579 。 领 域 知识 构成 的 基础 单元 是 概念 ,因此 B. C. 
Vickey 等 人 认为 生成 领域 性 专门 词 表 是 领域 分 析 的 一 
人 i 寺 要 目标 ”; 而 概念 关联 又 是 领域 知识 关联 的 本 质 
属国 ,因此 ,领域 知识 分 析 的 一 个 关键 目标 是 针对 特定 
针 霹 识别 其 概念 和 概念 间 的 细 粒 度 语义 关联 , 即 建立 
领域 概念 关联 体系 "”。 

3N 领域 概念 关联 及 其 在 知识 共聚 中 的 作用 

.人 知 识 单元 间 的 关系 包括 等 同 关系 .层次 关系 和 相 
闪 8 系 ,通用 性 的 知识 组 织 系 统 基于 这 些 关系 构建 。 
例 嫩 ,汉语 主题 词 表 中 的 用 、 代 、 属 分、 参 等 关系 与 等 
FREK .相关 关系 对 应 。 但 是 ,特定 领域 知识 组 织 

基 语 具体 化 和 差异 化 的 “相关 关系 ", 其 原因 是 :不 同 
领域 对 同一 概念 的 众多 特征 各 有 侧重 ,例如 ,水 "这 
一 概念 ,在 化 学 ,物理 学 .生物 学 .环境 科学 等 领域 所 补 


在 现 有 的 资源 系统 中 ,知识 内 容 的 组 织 结构 与 用 
户 需求 结构 并 不 一 致 。 用 户 知 识 需求 往往 围绕 特定 任 
务 的 解决 而 产生 ,这 就 决定 了 其 目标 知识 具有 一 定 的 
领域 性 , 即 其 所 需 知识 受 任务 对 应 领域 内 知识 结构 ( 如 
概念 、 概 念 关联 ) 的 约束 。 由 于 对 目标 知识 的 未 知 , 用 
户 和 需求 又 是 潜在 、 模 糊 的 ,其 知识 搜寻 行为 是 一 个 根据 
结果 不 断 学 习 、 优 化 和 反馈 的 迭代 过 程 。 然 而 , 现 有 的 
资源 系统 中 ,知识 内 容 以 “词语 ”为 代表 分 散在 不 同文 
档 中 。 缺 少 领域 知识 为 参考 时 ,不 得 不 基于 “相关 性 ” 
来 建立 的 知识 关联 ,以 推测 用 户 需 求 转化 的 方向 。 但 
这 种 方式 并 不 能 有 效 地 实现 用 户 需 求 引导 及 其 与 知识 
资源 的 匹配 。 研 究 表明 ,缺乏 领域 知识 指导 时 ,概念 关 
联 的 挖掘 会 存在 较 多 无 意义 的 结果 ,难以 满足 用 户 的 
特定 需求 。 

实质 上 ,无 论 用 户 需求 如 何 模糊 ,也 无 论 知识 资源 
如 何 分 布 ,两 者 之 间 在 领域 知识 背景 下 具有 一 致 性 。 
在 领域 知识 场景 下 ,知识 资源 中 的 知识 单元 以 不 同形 
式 的 关联 共同 构成 解决 特定 问题 的 知识 共聚 体 。 领 域 
概念 关联 体系 中 所 包含 的 明确 的 .丰富 的 概念 类 型 和 
细 粒 度 概 念 关联 ,是 揭示 词语 文档 等 知识 单元 间 多 维 
知识 关联 的 有 效 依据 ,由 此 对 知识 单元 进行 多 维 、 细 粒 
度 聚 合 ,可 交互 式 、 渐 进 式 地 引导 用 户 , 使 其 知识 需求 
在 领域 知识 空间 下 有 针对 性 地 横向 扩展 和 纵向 细 化 ， 
以 有 效 地 获取 和 利用 知识 。 
4 知识 共聚 的 四 种 基本 实现 形式 

知识 聚合 的 表现 形式 与 其 要 素 紧 密 相关 , 曹 树 金 
等 人 将 信息 聚合 要 素 归 纳 为 “聚合 对 象 粒度 .情景 K 
系 ”, 并 以 情景 分 析 为 基础 ,以 聚合 机 制 解释 和 聚合 应 
介绍 为 主要 内 容 , 对 信息 聚合 的 模式 和 相应 的 表现 
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关注 的 本 质 特征 差异 明显 。 相 应 地 ,引入 领域 背景 
知识 后 ,通用 层面 粗略 的 “相关 关系 "可 被 区 分 为 丰富 
多 样 的 细 粒 度 概 念 关联 ,例如 方法 与 应 用 关系 疾病 与 
症状 关系 。 领 域 概念 关联 相对 于 一 般 性 的 概念 关联 而 
言 ,有 两 个 明显 的 特征 :概念 的 内 涵 具 有 明确 定义 , 且 
概念 关联 的 类 型 是 具体 、 细 化 和 多 样 化 的 1。 

作为 知识 关联 本 质 层面 的 领域 概念 关联 是 实现 细 
粒度 多维 化 知识 共聚 的 基础 。 在 知识 共聚 模式 中 , 领 
域 概念 关联 的 作用 可 概括 为 :保障 知识 资源 组 织 结构 
与 用 户 知识 需求 结构 间 的 一 致 性 , 即 :已 有 资源 中 知识 
单元 及 其 关联 的 识别 和 利用 应 以 领域 概念 关联 体系 为 
参照 ,用 户 需求 的 转化 .扩展 和 细 化 也 在 领域 概念 关联 
体系 对 应 的 空间 内 引导 完成 。 


形式 进行 了 梳理 。 以 此 为 理论 基础 ,知识 共聚 的 基 

聚合 对 象 粒 度 :以 知识 资源 系统 中 的 词语 (如 关键 
词 .标签 .主题 词 .概念 术语 、 知 识 元 等 ) 和 文档 (如 网 
页 ,短文 本 ,学术 文献 等 ) 这 两 种 最 基本 的 知识 单元 为 
聚合 对 象 粒 度 ; 

聚合 情景 :以 用 户 知 识 探索 和 利用 过 程 中 两 类 知 
识 单元 间 的 转换 为 聚合 情景 。 例 如 ,通过 关键 词 获取 
文章 ,阅读 文章 后 探索 感 兴 趣 术语 相关 知识 等 。 总 体 
而 言 ,包括 在 从 词语 到 词语 .从 词语 到 文档 .从 文档 到 
词语 ,从 文档 到 文档 四 种 基本 情景 。 

聚合 关系 :以 领域 概念 关联 和 ”文档 - 词语 ”的 包 
含 关系 为 聚合 依据 ,领域 概念 关联 主要 用 于 构建 词语 
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间 的 多 维 关联 体系 , “文档 - 词语 ”的 包含 关系 用 于 将 
文档 资源 的 粗 粒 度 关系 映射 到 词语 层面 的 细 粒 度 概念 
关联 上 ,实现 对 知识 资源 的 多 维 、 多 粒度 聚合 和 对 用 户 
有 针对 性 地 引导 。 

相应 地 ,以 词语 ,文档 为 基本 粒度 ,以 词语 文档 在 
用 户 知 识 探索 和 利用 中 的 切换 路 径 为 情景 ,以 领域 概 
念 关联 和 ”文档 - 词语 "包含 关系 为 聚合 依据 ,可 将 知 
识 共 聚 的 几 种 基本 实现 形式 归纳 如 图 1 所 示 。 该 图 中 
的 四 个 象限 表明 用 户 从 对 应 的 需求 入 口 ( 横 轴 ) 探索 
对 应 的 聚合 目标 ( 纵 轴 ) 时 ,可 以 利用 到 的 知识 共聚 形 


聚合 目标 i 
文档 
v | 
= 人 
LO | 
N 词语 i 
E 
词语 文档 需求 人 口 
eo 
co 1 “词语 -文档 ”体系 下 知识 共聚 的 
e 四 种 基本 实现 形式 
co 
aN 从 词语 到 文档 :基于 分 面 导 航 的 知识 聚合 


CUHR 据 特定 词语 寻找 相应 文档 资源 是 用 户 最 普遍 的 
知识 探索 路 径 , 按 关键 词 检 索 文档 , 按 导 航 词 浏览 文档 
都 属于 这 种 形式 ,可 将 从 词语 到 资源 ( 主要 是 文档 ) 的 
引 厌 统称 为 “导航 "。 由 此 看 来 ,导航 是 知识 资源 聚合 
必 热 需要 考虑 的 重要 实现 形式 。 
-传统 知识 服务 平台 中 ,普遍 存在 导航 结构 扁平 化 、 
导 舌 词 间 语 义 关联 欠缺 等 问题 ,难以 满足 用 户 持续 性 、 
浙 进 式 的 知识 探索 需求 。 因 此 ,不 少 研究 者 从 知识 
聚合 的 视角 探索 导航 优化 。 李 亚 婷 认为 基于 知识 聚合 
的 导航 服务 不 应 仅仅 依赖 于 严格 单一 的 层次 结构 ,而 
应 注重 从 内 容 中 提取 到 全 类别" 。 胡 媛 等 人 提出 了 基 
于 知识 聚合 的 数字 图 书馆 社区 知识 导航 体系 框架 1。 
张 云 中 等 人 以 专家 分 类 法 与 大 众 分 类 法 互补 融合 为 思 
路 ,提出 了 tax-folk 混合 导航 模型 ,实现 了 树 状 * 干 强 枝 
繁 叶 茂 "的 资源 聚合 2 。 在 充分 利用 知识 关联 结构 和 
资源 属性 特征 的 前 提 下 ,可 构建 分 面 式 导航 体系 ” 。 
相对 传 于 统 基于 相似 度 或 分 类 /主题 表 的 导航 体系 而 
言 ,分 面 式 导航 体系 充分 保留 了 结果 文档 与 导航 词汇 
的 多 样 性 关系 ,同时 也 更 符合 用 户 资源 导航 习惯 。 这 
也 是 知识 共聚 模式 下 的 资源 导航 实现 形式 。 

引入 领域 概念 关联 体系 后 ,可 对 知识 系统 中 原 有 
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的 导航 体系 进行 分 面 化 改造 。 具 体 思 路 如 图 2 所 示 : 
首先 ,从 原 有 导航 词 中 筛选 出 领域 概念 术语 ,以 排除 资 
源 定位 效果 差 的 导航 词 精简 导航 方向 (如 图 2 rn, ol 
除了 原 导 航 体系 的 bfg 等 词 ) ;其 次 ,基于 领域 概念 
类 型 和 细 粒 度 关联 设置 导航 分 面 (如 图 2 中 所 设 的 3 
个 分 面 ) 。 导 航 词 各 代表 一 个 文档 集合 ,由 此 将 已 有 的 
大 量 文档 资源 按 分 面 导 航 方式 进行 聚合 组 织 。 基 于 该 
思路 ,笔者 以 丁香 园 医学 社区 中 的 心血 管 论 坛 为 例 , 构 
建 了 分 面 导航 体系 以 实现 UGC 资源 的 知识 共聚 ,其 系 
统 原型 如 图 3 所 示 ” 。 


RIMER pippDD5DIDDED * 


| 分 面 改造 


概念 类 型 1: JCC- 


分 
领域 概念 N 面 ， 
x = | J " 
€ EDD 
航 。 概念 类 型 


O J E 


2 基于 分 面 式 导航 的 知识 聚合 实现 形式 


SZ ISBRE mon [a | 
“ 冠 心病 ”相关 讨论 
并 发 证 ; 7025888(705) ”心肌 梗死 (731) R529) 98490) ”心律 失常 (465) ”心脏 病 (401) ”更 多 >> 
RTR: E338) 心肌 缺 血 (235) 询问 (273) ”水 着 (204) 08(195) 呼吸 困难 (180) ”更 多 >> 
meum: 心脏 (792) ”血管 (528) (58526) (02385) MBK280) 308273) ”心房 (156) ”更 多 >> 
诊断 方法 ; 心电图 (544) 188235) GRENG)  WWSHRE154) 。 冠状 动脉 造影 (123) MAMUT) ”更 多 >> 


JAMA Pediatr : 先天 性 心脏 疾病 (CHD ) 的 产 前 诊断 有 利于 新 生 儿 的 大 脑 发 育 
该 研究 的 目的 是 在 产 前 vs 产后 诊断 CHD 的 新 生 儿 证， 比较 术 前 和 术 后 及 损伤 的 发 闹 字 和 大 及 发 
育 的 轨迹 。 ”来生 美国 日 全 山 加 利 福 尼 亚 大 学 和 不 列 生 哥伦比亚 大 学 的 研究 人 员 
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42 从 词语 到 词语 :基于 多 维 概念 关联 推荐 的 知识 聚合 

当 用 户 检索 或 浏览 某 一 词语 相关 文档 时 , 与 该 词 
语 相关 的 其 他 词语 构成 其 目标 知识 的 一 部 分 。 用 户 知 
识 搜寻 和 利用 行为 是 一 个 持续 过 程 ,通常 需要 不 断 地 
横向 拓展 和 纵向 深入 。 搜 索 列 表 页 的 查询 词 推 荐 . 结 
果 内 容 页 的 标签 推荐 等 都 属于 “从 词语 到 词语 ”的 知 
识 引导 。 因 此 ,知识 聚合 的 有 效 实 现 需要 充分 考虑 这 
一 场景 。 

传统 的 词语 推荐 通常 依托 日 志 .文档 等 语 料 , 对 词 
语 按 相似 度 计算 和 排序 ” ,再 以 线性 方式 列举 推荐 ， 
其 语义 模糊 性 导致 用 户 知 其 有 关 而 不 知 其 何 关 , 不 利 
于 用 户 需 求 的 进一步 扩展 和 细 化 。 因 此 ,有 必要 加 入 
语义 信息 以 使 之 更 符合 用 户 知识 结构 。 陆 伟 等 人 通过 
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实验 表明 ,采用 主题 分 析 可 以 显著 提升 查询 推荐 的 精 
确 度 ” 。 洪 婕 等 人 认为 ,在 领域 型 知识 系统 中 ,依托 
语义 资源 库 来 构建 查询 推荐 体系 是 一 个 很 好 的 选择 ， 
并 通过 实验 论证 了 利用 领域 本 体 可 获得 比 百度 、google 
查询 推荐 更 好 的 效果 。 靳 延安 则 系统 地 讨论 了 基 
于 语义 粒度 .话题 敏感 性 .用 户 动机 的 标签 推荐 技 
术 ” 。 事 实 上 ,相关 词 推荐 的 核心 目标 是 构造 用 户 后 
续 知 识 场景 (如 纵向 深入 \ 横 向 扩展 ) 变 化 的 空间 。 而 
词语 的 内 涵 通 常 基于 它 与 其 他 词语 的 概念 关系 来 表 
现 ,与 当前 词 相关 的 其 他 词语 极 有 可 能 是 用 户 接 下 来 
需求 扩展 或 细 化 的 目标 。 因 此 ,对 相关 词语 按 概念 关 
联 进行 多 维 聚 合 以 开展 相关 推荐 ,是 实现 “从 词语 到 词 
语 "场景 下 知识 共聚 的 一 种 重要 方式 。 

本 如 图 4 所 示 , 引 入 领域 概念 关联 体系 后 ,将 用 户 人 
中 词 相关 的 概念 及 其 细 粒 度 关联 引入 到 词语 推荐 中 ， 
璇 殉 具 有 多 维 结构 的 相关 词 推荐 。 一 方面 可 排除 与 领 
域 知识 无 关 的 干扰 词 ; 男 一 方面 ,通过 标明 相关 词语 与 
人 C 硬 词 的 细 粒 度 关联 类 型 (如 图 4 右 侧 a 词 的 相关 词 
上 其 和 有 不 同 推荐 维度 ) ,用 户 可 以 有 针对 性 地 选择 下 一 步 
知 测 搜寻 的 方向 。 由 此 可 实现 对 知识 系统 中 词语 的 有 
就 琵 合 。 基 于 该 思路 ,笔者 以 丁香 园 医学 社区 中 的 心 
Jff 萎 论坛 为 例 ,构建 了 基于 概念 关联 的 多 维 推荐 体系 
VES UCC 资源 的 知识 共聚 ,其 系统 原型 如 图 5 所 
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图 4 基于 多 维 概念 关联 推荐 的 知识 聚合 


4.3 从 文档 到 词语 :基于 知识 元 链接 的 知识 聚合 
文档 中 具有 语义 内 涵 的 概念 单元 可 称 为 知识 元 ， 
一 篇 文档 的 知识 价值 体现 为 将 多 个 知识 元 按 若 干 关联 
组 织 起 来 。 用 户 浏览 特定 文档 时 ,通常 会 对 其 中 某 些 
知识 元 感 兴趣 。 如 何以 文档 中 的 知识 元 为 载体 开展 相 
关内 容 聚 合 , 是 解决 知识 在 文档 中 “碎片 化 ”分布 . 实 
现 海量 文本 聚合 向 精准 化 知识 聚合 的 重要 途径 。 
知识 元 链接 体系 是 在 用 户 文档 浏览 场景 下 实施 知 
识 共 聚 的 重要 形式 。 曾 建 勋 认 为 基于 知识 元 链接 构建 
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图 5 基于 多 维 概念 关联 推荐 的 心血 管 领域 
UGC 知识 聚合 示例 


知识 网 络 是 知识 链接 的 一 个 重要 方向 ”。 孙 震 等 人 
提出 基于 知识 元 的 新 型 科学 计量 范式 ,其 核心 是 以 专 
业 问 题 和 学 科 的 知识 点 作为 计量 口径 和 知识 基础 单 
元 。 毕 崇 武 等 人 认为 将 知识 元 以 链接 的 方式 关联 
起 来 ,可 以 将 最 细 粒 度 的 知识 元 聚 类 为 不 同 粒度 的 知 
识 集合 ,并 提出 了 基于 知识 元 的 多 粒度 知识 集合 组 织 
方式 ”i。 陈 果 等 人 提出 了 融合 领域 知识 库 和 共 现 分 
析 的 网 络 社区 知识 元 链接 体系 构建 方案 ,通过 构建 知 
识 元 链接 体系 ,实现 网 络 社区 中 碎片 化 知识 的 深度 连 
3), 

基于 知识 元 链接 的 知识 共聚 实现 思路 见 图 6。 首 
先 ,通过 参考 领域 概念 关联 体系 中 的 概念 术语 对 文档 
中 的 领域 概念 进行 知识 元 标注 ,将 其 指引 到 相应 的 知 
识 元 内 容 页 ;其 次 ,构建 知识 元 内 容 页 ,其 组 成 一 般 包 
括 知识 元 的 基本 内 涵 .与 该 知识 元 相关 的 其 他 知识 
元 .与 该 知识 元 相关 的 文档 资源 等 。 通 过 构建 独立 
的 知识 元 链接 体系 ,可 在 不 改变 原 有 资源 组 织 架 构 
的 前 提 下 ,在 文档 内 实现 相关 知识 元 的 内 容 聚 合 。 
基于 该 思路 ,笔者 以 丁香 园 医学 社区 中 的 心血 管 论 
坛 为 例 , 构 建 了 知识 元 链接 体系 以 实现 知识 共聚 ” ， 
其 文档 中 知识 元 标注 结果 示例 见 图 7, 知 识 元 内 容 页 


示例 见 图 8。 
文档 -词语 体系 。 ”文档 -知识 元 体系 。 知识 元 内 容 页 
文档 文档 i 


Ge M 
OO TT 
OOT x 


» 


ui 
7---r-- 


CC) 


领域 概念 
关联 体系 


图 6 基于 知识 元 链接 的 知识 聚合 
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u 
相关 疾病 : ”高 血压 mom 
80+ 女 性 , 既往 RAS . SS AL, ESRA Wa 。 5 年 余 ,加重 1 月 2011 年关 行 和 E39 s 
LADISMERSO-69,4 mm  (-),T BOS ”二 级 预防 等 治疗 ,但 患者 仍 有 发 作 性 08 . Wa 。 此 
次 系 加 量 1 月 来 院 ， 入 院 当 天 夜间 ma 。 发 作 时 有 一 过 性 心率 慢 ， 最 慢 至 30 多 次 /分 , 监护 提示 舌 发 m" MEUS 
联 律 ， 心电图  UEMUERRUBGERSTENENE, S Nune 。 0.14ng/ml ( 入 院 时 正常 0.01ng/ml ) ， 拒 绝 行 急诊 
PCI, 予 硼酸 甘油 各 系 后 伍 状 好 转 ， 心 电 监护 似乎 看 到 ST 段 回 著 , 未 行 心电图 。 检查 ; 晨 起 再 次 诉 Ra , PRENA 
WOWESPEE ORB  HUIDBORGIKNSUS, RESIRE/DAT. URRUPNS BEE TMEK, CU 
次 发 作 不 同 导 联 , 莫非 是 不 同 mum 。 了 求助 大 神 ，*! 


图 7 心血 管 领域 UGC 资源 的 知识 元 标注 示例 


WSST 血管 造影 。 更 多 >> 


ERES) FEJRE > 


化 得 出 血 RERUSILESS ? IARNA ? 


T 
E 心血 管 领域 知识 元 内 容 页 中 的 知识 聚合 示例 


46] 从 文档 到 文档 :基于 资源 潜在 关联 发 现 的 知识 聚合 
文档 是 用 户 获取 知识 的 最 终 载体 ,从 文档 到 文档 
ERE AERAR. 常见 文本 聚合 形式 
部 属性 信息 或 内 容 标注 为 特征 计算 相似 度 ， 
€ | 5 这 种 聚合 方式 的 主要 
硬是 是 结果 元 余 度 过 高 ,而 忽略 了 文档 间 的 潜在 语义 

关 现 ,因而 在 解决 面向 任务 的 知识 需求 时 存在 明显 缺 
陷 世 例如 ,用 户 浏览 了 关于 “高 血压 "介绍 的 文档 后 ， 
j 事 需要 了 解 与 其 中 某 些 症状 相关 的 内 容 , 而 非 更 多 
关 66* 高 血压 "介绍 的 相似 文档 。 

. 刁 为 解决 这 一 问题 ,研究 者 从 语义 层面 开展 文档 次 
源 笑 联 发 现 研究 。 陈 兰 杰 和 修 鹏 娟 将 数字 文献 资源 关 
联 自 系 揭示 方法 划分 为 挖 所 关联 关系 方法 和 构建 关联 
关系 方法 ,后 者 包括 语义 与 本 体 方法 .关联 数据 方法 
等 ,并 指出 各 自 优 缺 点 涪 ] 。 赵 夷 平和 毕 强 提 出 利用 潜 
在 语义 分 析 与 向 量 空间 模型 计算 文档 内 容 的 相似 性 ， 
再 将 语义 关联 信息 和 文档 元 数据 合并 为 关联 数据 , 实 
现 后 续 的 相似 文献 发 现 ;他 们 同时 指出 ,以 客观 知识 体 
系 和 知识 结构 为 基础 的 文献 关联 发 现 应 更 能 体现 相关 
文献 的 关联 程度 ""。 洪 韵 佳 和 许 侈 提出 了 一 种 基于 
领域 本 体 的 适用 于 知识 库 树 状 结构 的 多 层次 文本 聚 类 
方法 ,实现 了 从 粗 粒 度 到 细 粒 度 的 多 层次 聚 类 。 

在 知识 共聚 模式 下 ,以 领域 概念 关联 为 依托 ,可 参 
Vier gt ti ae 

0: 在 两 个 相对 独立 但 其 对 应 概念 存在 关联 的 文献 间 
“si 进一步 实现 文档 聚合 。 基 本 实现 方法 如 图 
9 所 示 : 如 果 文档 A 中 出 现 领域 概念 al ,文档 B 中 出 现 
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领域 概念 2 , 而 在 领域 知识 体系 中 al 和 a2 存在 某 种 
细 粒 度 关系 , 则 可 在 A 与 B 之 间 初 步 标注 这 种 关联 关 
系 ;通过 对 A 与 B 间 更 多 初步 关联 的 统计 可 确立 其 最 
终 关联 类 型 。 在 具体 实践 中 ,笔者 针对 丁香 园 医学 社 
区 中 的 心血 管 论坛 开展 了 基于 关联 发 现 的 文档 聚合 实 
验 ,以 “ 冠 脉 造影 "为 例 ,只 有 61% 的 讨论 贴 是 通过 直 
接 关 联 与 “ 冠 心病 ”讨论 实现 聚合 , 剩 下 39% 需要 依托 
领域 概念 关联 体系 冠 脉 造 影 与 冠 心 病 的 诊断 关系 来 实 
现 聚 合 , 其 效果 改进 可 见 一 斑 ” 。 


图 9 基于 资源 潜在 关联 发 现 的 知识 聚合 
5 结语 


知识 聚合 模式 的 研究 不 仅 应 关注 基于 何 种 知识 关 
联 来 开展 聚合 ,还 应 探讨 利用 这 些 知识 关联 将 知识 单 
元 聚合 成 什么 形式 。 鉴 于 后 者 相关 研究 较为 缺乏 ,本 
文 参考 化 学 领域 中 聚合 反应 的 两 种 类 型 ,将 知识 聚合 
模式 划分 为 知识 类 聚 和 知识 共聚 两 大 类 ,其 区 别 为 在 
聚合 中 是 否 保留 知识 单元 及 其 关联 的 多 样 性 。 基 于 领 
域 知 识 分 析 视 角 ,可 知 知识 共聚 模式 实现 的 基础 是 领 
域 概念 及 其 细 粒 度 关联 的 有 效 利 用 。 在 “文档 - 词 
语 "形式 的 知识 资源 体系 下 ,以 文档 .词语 为 基本 知识 
单元 粒度 ,以 用 户 需求 和 人口 和 聚合 目标 资源 为 维度 ,可 
将 知识 共聚 模式 的 实现 形式 划分 为 基于 分 面 导航 的 知 
WRA .基于 多 维 概念 关联 推荐 的 知识 聚合 .基于 知识 
元 链接 的 知识 聚合 .基于 资源 潜在 关联 发 现 的 知识 聚 


A 
Ho 


知识 聚合 的 开展 同时 受 资源 组 织 结构 和 用 户 需求 
结构 的 影响 ,由 领域 概念 及 其 细 粒 度 关联 构成 的 领域 
知识 是 保障 两 者 一 致 性 的 关键 。 当 前 利用 特定 领域 的 
知识 背景 以 开展 知识 聚合 的 研究 和 实践 较为 缺乏 ,而 
针对 特定 领域 资源 开展 的 知识 聚合 与 通用 性 的 知识 聚 
合 在 模式 上 存在 很 大 区 别 。 随 着 知识 聚合 研究 和 实践 
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ER, KM, KI. 知识 共聚 :领域 分 析 视 角 下 的 知识 聚合 模式 [J]. 图 书 情报 工作 ,2018,62(8):115 - 122. 


的 逐 


步 深 入 ,针对 特定 领域 进行 知识 聚合 将 面临 新 的 


问题 ,本 文 所 提出 的 知识 共 肾 模式 及 其 实现 形式 是 一 
种 基本 途径 ,在 后 续 研 究 和 实践 中 也 将 得 到 进一步 完 


善 。 
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Knowledge Copolymerization: A Knowledge Aggregation Mode Under the 
Perspective of Domain Analytic Paradigm 
Chen Guo' Wu Wei Xiao Lu 
! Department of Information Management, Nanjing University of Science and Technology, Nanjing 210094 
* School of Journalism, Nanjing University Of Finance & Economics, Nanjing 210046 
Abstract. [ Purpose/significance] Current research on knowledge aggregation mode focuses on the types of knowl- 
edge connection that knowledge aggregation is based on. As an indispensable complementary, this paper explores the fol- 
low-up question of what form knowledge elements can be aggregated based on those connections ,it aims at perfect the re- 
search of knowledge aggregation mode and guide related practice. [ Method/process | Taking the classification of poly- 
merization in chemistry, this paper put forward to divide knowledge aggregation mode into homopolymerization and copoly- 
merization according to “ whether or not remain the differences between knowledge units and their correlations" , and then 
explored the basic realization forms of knowledge copolymerization. [ Result/conclusion | Domain knowledge is the basis 
of'knowledge copolymerization. Utilizing documents and words as two basic knowledge elements, and considering users’ 
demand portals and target knowledge elements as two dimensions, knowledge copolymerization can be achieved through the 
following four basic forms; based on faceted navigation, multidimensional recommendation based on conceptual relation, 
based on knowledge element linking, and knowledge discover based on the potential connection of resources. 
Keywords: knowledge organization knowledge aggregation mode knowledge copolymerization domain analytic 
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KB) 情报 共生 的 机 理 与 实现 策略 研究 面向 科技 服务 的 多 层次 作者 分 析 模 型 及 实证 研究 
(WE FRE Ah) GER) 
试 论 政府 数据 治理 的 内 涵 、 生 成 背景 与 主要 问题 基于 SKOS 的 学 术 期 刊 文本 资源 多 粒度 语义 标注 方法 
(EUR) 研究 ( 夏 立 新 郑 路 KERF) 
公共 图 书馆 创 客 空间 用 户 使 用 意愿 影响 因素 实证 国内 在 线 健康 社区 研究 现状 综述 (起 栋 祥 ) 
研究 (RE BhP) 
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